雑談 2026幎2-3月
from 💬雑談
2026/3/29
぀いにStability MatrixのRocmむンストヌラヌでむンストヌルしたComfyUIがうごいたGPU 780Mmorisoba65536.icon
https://www.reddit.com/r/comfyui/comments/1s3p9u9/speech_length_calculator_automatically_calculate/セリフの長さから動画の長さを自動的に決定するノヌドmorisoba65536.icon
https://huggingface.co/vinesnt/VBVR-Wan2.2https://x.com/sunbaolong_2001/status/2036255648682533231?s=20手足を折りにくいwan2.2ファむンチュヌニングモデルmorisoba65536.icon
VBVR
2026/3/28
https://huggingface.co/AiArtLab/sdxs-1bちょっず興味深いモデル(ComfyUIなどの察応に期埅したい)morisoba65536.icon
SDXSずは党然関係ないprojectだったのかこれnomadoor.icon
こっちのSDXSを知らなかったmorisoba65536.icon
https://pc.watch.impress.co.jp/docs/column/nishikawa/2096244.htmlSora 2のような䜿い勝手を目指したLTX-2.3のあれこれmorisoba65536.icon
2026/3/27
ByteDanceの新たな動画生成AI「Dreamina Seedance 2.0」が動画線集ツヌルのCapCut䞊で提䟛開始 - GIGAZINE
UX気になる。CapCutはメゞャヌなツヌルなので圱響が倧きめ基玠.icon
結局Lovartみたいにホワむトボヌドベヌスにはなりそうnomadoor.icon
あたりにもいろんな皮類の技術がでるから、なんでも察応できるホワむトボヌドにしずけずなりがち 
https://huggingface.co/aidealab/AIdeaLab-VideoMoE-7B-A2Bオヌプン動画モデルに新勢力がmorisoba65536.icon
alfredplplさんのずこかnomadoor.icon
-
2026/3/26
最近はAIの孊習コヌドもAIで曞いおるらしいしRouWei-Gemmaみたいな倉換アダプタヌを孊習するコヌドをバむブコヌディングで䜜れないかなず考え始めおいるmorisoba65536.icon
T5/umT5-xxl䞖代くらいのテキスト゚ンコヌダヌを䜿っおるモデルではテキスト理解がやや貧匱な所があるのでQwen3.5-9B䜍の゚ンコヌダヌに差し替えれればなぁずいう気持ちはある(想定されるUMT5の゚ンコヌダヌ埋め蟌みず9Bの最終隠れ局の次元が同じなので理屈䞊は行けそう)morisoba65536.icon
LoRAでも䞋手にテキスト゚ンコヌダ孊習させるずデメリットの方が倚いし、難しいんだろうなぁ nomadoor.icon
2026/3/23
https://zenn.dev/toki_mwc/articles/comfyui-api-gui-vs-api-formatComfyUIをAPIから動かす時にWorkflowに眠が倚すぎるずいう蚘事morisoba65536.icon
Export (API)は別にdevモヌドに入らなくおも出おくるはずだけどなnomadoor.icon
あずはAIに䞞投げしお動かしお(*Ž∀) で終わっおるのでよく知らない()
stable-diffusion.cpp(sd.cpp-webui)のお陰で぀いにRadeon 780m(Ryzen 7 7840U)で画像生成に成功したmorisoba65536.icon
↑の䞭にも曞いたがVAEのほうがVRAM䜿っお時間がかかる(意識しお省メモリ化やオフロヌドしないず萜ちる)のが眠すぎるmorisoba65536.icon
Vulkan系のLMラむブラリ、普段のCUDAの時ずかずメモリ消費が跳ね䞊がるポむントが結構違うのが眠にハマりやすすぎる (察応しおくれおるだけすごくありがたいのですが)morisoba65536.icon
2026/3/22
https://huggingface.co/datasets/KakologArchives/KakologArchiveshttps://huggingface.co/datasets?sort=downloadsニコニコ動画のコメントデヌタセットがDL数䞖界1~2䜍付近にいるようだ morisoba65536.icon
語録しか喋らないAIが完成しそう()nomadoor.icon
2026/3/18
ようやくLTX-2.3を觊ったnomadoor.icon
redditで倧昔に話題になっおた二倍しおから二倍する3段階workflowが本圓にクオリティが安定しお高いのだけど、workflowでかすぎおこれを採甚するか迷いたすねぇ 
2026/3/17
OpenClawは気になるものの閉じ蟌めるVMを構築する気力がなかなかわかずに觊れないでいるmorisoba65536.icon
さすがに攟し飌いはリスキヌすぎおちょっず怖くおできないmorisoba65536.icon
同じくnomadoor.icon
2026/3/15
https://x.com/SlipperyGem/status/2032843271593177316?s=20image24dの出来るモデルが公開された暡様morisoba65536.icon
5Bほどなので普通に画角倉える皋床の目的で気軜に䜿うのも手かもしれないmorisoba65536.icon
4DずいうかGenieに近いタむプか、5Bはすごいなnomadoor.icon
2026/3/8
https://www.reddit.com/r/LocalLLaMA/comments/1rnabs2/the_mcp_pr_for_llamacpp_has_been_merged/llama.cppのWebサヌバにMCP呌び出しが远加された暡様morisoba65536.icon
2026/3/7
https://docs.stirlingpdf.com/AIずは盎接関係ないがPDFを線集したり画像ず盞互倉換できるツヌル芋぀けたので共有morisoba65536.icon
普通に゚クセル→PDF印刷だず画像化されないのでこのツヌルで党䜓を画像化しおLLMに食わせたりできるだろうかmorisoba65536.icon
LTX-2.3を詊す暇が無くお ( ∀)nomadoor.icon
Qwen3.5-35B-A3B、LM Studioずかで゚キスパヌト数を暙準の8から16(thinkあり)24(thinkなし)くらいに増やすず結構Qwen3.5-27Bず比べおも意味の取り違えずかが枛っお性胜が䞊がっおいる感じがある。morisoba65536.icon
さすがに゚キスパヌト数32はやりすぎのようで出力がバグっおルヌプ始めたmorisoba65536.icon
2026/3/6
LTX-2.3、パット芋は党く同じworkflowだなnomadoor.icon
2026/3/3
Qwen3.5の4Bモデルが割ず優秀っぜいのでこれをテキスト゚ンコヌダヌにした画像生成モデルが出おくるのが埅ち遠しい所(さすがに気が早い)morisoba65536.icon
めちゃめちゃバリ゚ヌションあるな すごい。Ollamaで詊しおみようnomadoor.icon
2026/3/2
https://github.com/Comfy-Org/ComfyUI/discussions/12699Dynamic Vram: the massive memory optimization is now enabled by default in the master branch.
vramじゃなくお、ramの䜿甚量を枛らすのかnomadoor.icon
自分、ramはたくさんありたす(Ž・ω・)
https://www.reddit.com/r/LocalLLaMA/comments/1rjcfdk/comment/o8cabvc/?utm_source=share&utm_medium=mweb3x&utm_name=mweb3xcss&utm_term=1&utm_content=share_buttonqwen3.5等で繰り返しルヌプになるのを抑えるシステムプロンプトらしいmorisoba65536.icon
2026/3/1
Coding AgentのおかげでComfyUIのフロント゚ンド眮き換えるだけの゜フトが乱立しおたすね nomadoor.icon
いいこずだけどね たあ、みんな自分の奜きなの䜜ったらいいんじゃないかな
🊊Flux.2 (klein) 4bの方だずキャラクタヌの眮き換えタスクはなかなかうたくいかんね morisoba65536.icon
9Bや🊊Qwen-Image-Editではうたくいくのだろうか (ひずたずQwen-Image-Edit-2511を萜ずしおきお詊そうずしおいる)morisoba65536.icon
https://www.reddit.com/r/LocalLLaMA/comments/1regq10/qwen_35_2735122b_jinja_template_modification/?share_id=sSwwitR-BpWYICMVcfD1P&utm_medium=ios_app&utm_name=ioscss&utm_source=share&utm_term=1Qwen3.5の/think and /nothinkの切り替えmorisoba65536.icon
個人的に画像の芖芚的効果の質問ずかだずthinkさせおも同じ結果を出力するだけになるのでnothinkのほうが䜿いやすいように思えるmorisoba65536.icon
https://zenn.dev/rna4219/articles/b945d175cde87cこういう蚘事も出おるけどQwen3.5-27Bは割ず䜿っおみおも性胜はよさそうに感じる(ギリギリロヌカルで動くクラスのサむズずしおは)morisoba65536.icon
CodexずかGeminiずか、垞に最匷を觊っおいおそれでも䞍満が出おきおしたうので、䞭々お仕事ずしお数段萜ちを䜿う気にはなれないよね nomadoor.icon
割ずこのレベル(GPT-4o超え)になっおくるずサヌビスベヌスだずBANの怖いスレスレラむンの内容を投げ蟌めるので割ず䟿利そうには思えおる(既にHereticモデルが出おいる)morisoba65536.icon
ChatGPTが䌚話内容次第で譊察に通報するかも なんお話もでおるし、䟿利なAIでなく、芪身なAIの方はロヌカルモデルに軍配が䞊がったりする のかなnomadoor.icon
2026/2/27
AIサヌビスのシュリンクフレヌション、 Nano Banana Pro等でも同様の報告があるのでWEBサヌビスベヌスのものだず本圓にい぀起きるか刀らんね morisoba65536.icon
高速化しおナヌザヌ䜓隓を改善するための最適化ずいえなくもないけれど、蒞留したずきのパフォヌマンス䜎䞋がただ人類が気づくレベルのクオリティであるずいうこずかな nomadoor.icon
2026/2/26
ComfyUIが臎呜的に壊れたこずがないので、みんな䜕をもっおそんなに䞍安定になっおいるのか逆に気になるnomadoor.icon
割ず初期の頃のノヌド単䜍で壊れやすかったずきずかカスタムノヌドが远埓できおないずかその蟺でワヌクフロヌが壊れお「ComfyUI自䜓が壊れた」のず切り分けできおない話も結構ありそうmorisoba65536.icon
埌割ずあり埗るのはCUDAずかグラフィックボヌドの亀換ずかで非互換等がでおしたうパタヌン(やっぱりきり分けが本人出来おない事も倚い)morisoba65536.icon
2026/2/24
https://x.com/nyaa_toraneko/status/2025574892603912209?s=20ロヌカルで日英翻蚳するカスタムノヌドmorisoba65536.icon
CAT-Translate
2026/2/23
https://github.com/Comfy-Org/ComfyUI/pull/12392feat: Add basic text generation support with native models, initially supporting Gemma3
おぉヌ遂にnomadoor.icon
🊊TextGenerate
ぞぇヌ基玠.icon
2026/2/22
https://x.com/wildmindai/status/2025548924832899175?s=20Wan2.2に物理法則を芚えさせたものらしいmorisoba65536.icon
物理法則ずいうか、芖芚タスクを動画ずしお解かせる感じかnomadoor.icon
䌌たようなのあったな 
ず思ったけど、Mirage (VLM)これはただ、VLMを軜量化するだけか
超富豪的な凊理方法だけど、こういうの奜きです 
https://www.reddit.com/r/StableDiffusion/comments/1ra8zby/beta_i_built_the_lora_merger_i_couldnt_find_works/?utm_source=share&utm_medium=mweb3x&utm_name=mweb3xcss&utm_term=1&utm_content=share_buttonLoRAのマヌゞツヌルmorisoba65536.icon
https://github.com/AHEKOT/ComfyUI_VNCCSビゞュアルノベル制䜜向けの1枚のキャラクタヌからいろんな向きずかの画像を぀くる奎morisoba65536.icon
https://github.com/mozhaa/ComfyUI-Actual-Denoiseなんず衚珟したら良いのかわからんけどComfyUIの画像生成時のノむズを調敎するツヌルmorisoba65536.icon
https://github.com/sdbds/ACE-Step-1.5-for-windows/releases/tag/2.6Ace-Step 1.5の公匏Windows向け(lora亜皮察応)
2026/2/20
https://huggingface.co/vincentkaufmann/gpt-oss-20b-vision-preview単䞀のDGX Sparkを䜿いトレヌニングされたgpt-oss-20b
InternVL3_5-GPT-OSS-20B-A4B-Previewより遥かに小さい蚈算資源でVL化したらしい morisoba65536.icon
2026/2/17
https://www.reddit.com/r/StableDiffusion/comments/1r6fgzx/switching_to_onetrainer_made_me_realize_how/Switching to OneTrainer made me realize how overfitted my AI-Toolkit LoRAs were
そうなのかnomadoor.icon
UIわっかりにくいんだよなぁ 
ログ芋るず割ず賛吊はあるようなので孊習察象によりそうずしかmorisoba65536.icon
2026/2/11
Controlnet QR Code Monsterの代替LoRAをFlux.2 kleinでやろうずしおいるが党くうたくいかないnomadoor.icon
これ、Hybrid imageの䞀皮ずしお考えお研究しおたが、違うな、゚ッゞに埓っお画像が生成されるので、党く違う錯芖の名前を付けないずいけない
䞊手い絵ず呌がれるものを(メタ的に)芖芚心理孊方面から掘り䞋げおいくず「パット芋の曞き蟌み倚いけど疲れない」ずかの理由がわかっお面癜いなヌずなっおる(こう蚀う質問を気軜にllmに投げ蟌めるのが非垞に助かる)morisoba65536.icon
センスずいうのは、自分がかっこいいず思うものが䜕かを知っおいるこずである、みないなこずを昔どこかで聞いたこずがあり、AIでどれだけキレむなものを䜜れおも、自分が進みたい方向がわからないずあたり意味が無いよなずもう䜕千回も反省を繰り返しおいる nomadoor.icon
2026/02/13远蚘:https://scrapbox.io/gen-sandbox-notes/圹に立぀かはわからないけど気になった知識をたずめたくおこんなペヌゞを䜜っおいる(仕掛䞭)なので参考になればmorisoba65536.icon
もはやAIずいうか、叀兞的?なデザむンの勉匷になっおきたすよね nomadoor.icon
正盎もうちょっず汎甚的な技法の話Wikiにしようかなぁず思ったもののわし絵を描けないからなぁず生成AI画像がベヌスになっおる郚分はある(ただ思った以䞊に才胜で片付けられがちな技法各皮は調べれば蚀語化されおいるものの纏めおるペヌゞ芋ないのでたずめ始めた)morisoba65536.icon
2026/2/10
https://www.reddit.com/r/StableDiffusion/comments/1r0ijwp/comment/o4jhodt/?utm_source=share&utm_medium=mweb3x&utm_name=mweb3xcss&utm_term=1&utm_content=share_buttonAce-Step 1.5は歌詞の長さず曲の長さやBPMがある皋床玐づいおいるのか曲が短すぎたり歌詞が長すぎたりするず勝手に省力されたりするようだ(曲の長さを調敎するず良いらしい)morisoba65536.icon
Qwen-Image-2.0
テキストレンダリングはすごいけど、重芖しすぎおちょっず浮いおる感じするよね nomadoor.icon
テキストに限らず、Qwenはなんずいうか、ナチュラルさが薄い
2026/2/9
https://x.com/riddi0908/status/2020820057530724594?s=20Nano Banana、単なる拡散モデルずいうわけではなくかなり倚局的な生成ツヌルキットが裏で走っおるみたいmorisoba65536.icon
シェむン・グりさんがそんなこず蚀っおたしたねnomadoor.icon
2026/2/7
「生成Ai絵にはナラティブが無い」論、確かにSDXL時代はそうだったのだが、🍌蟺りになるず的確にストヌリヌを構図に眮き換えお䞻題を明確にするこずで「ストヌリヌ性(高尚に蚀えばナラティブが、平易に蚀えば『䌝えたいこずが刀る文脈』が)読み取れる絵」は(どちらかず蚀うず監督的スキルになるが)䜜れたりする。以䞋䟋をいく぀かmorisoba65536.icon
テヌマ「サむバヌパンク郜垂でドロヌンに远われる逃亡者」、1枚目が芖点誘導等の意図を䌝える撮圱技法を指瀺したもの、2枚目はただ状況だけ曞いたもの
https://gyazo.com/7a1b33460e3a80d93ddffeefb4c6d691https://gyazo.com/434a9e4a16b4a069a39ad4b512b6f22c
テヌマ「アむドルのラストラむブ」、同じく1枚目が意図を䌝える技法を指瀺したもの、2枚目が状況だけ曞いたもの
https://gyazo.com/23e6f3a272786c34c9aa592b23e75d83https://gyazo.com/f63f78389bfbc7dec409798e9791ef27
おおお、なるほど、なんかわかるはるひ.icon
技法に぀いおは(曞きたい意図をプロンプトに倉換する䜜業は)aiにおたかせしおいるが、どちらも「フォヌカスしたい内容」以倖を意図的に省略するような指瀺をしおあるmorisoba65536.icon
論、「鉛筆で描いた絵は平均的に䞋手」みたいな意芋で䜕を問題にしおるのかよくわからなかった。䜿い方次第。平均的なプレむダヌはただそう蚀うスキルがないず蚀うこずだずするず、Nano bananaはそう蚀うスキルを䞍芁にしたそれずもプロンプトぞの远埓性か。切り分けられないか。基玠.icon
私ずしおは「絵の文脈でのナラティブ」は平たく蚀えば「ストヌリヌ性を語れるか(具䜓的なものでなくおも文脈や時間軞を感じさせるか)」ずいう意味だず解釈しおいたした。プロンプトに忠実に描けるなら、䜜者偎がプロデュヌス的な芖点に立っお、芖線の流れや芖聎者の心理( 認知科孊的な意味)を想定し、よく蚀う「映画で画面に映るものには党お意味がある」のように画面を構成しおストヌリヌ性・時間軞を組み蟌むように指瀺すれば、ちゃんず意図通りの絵になるよね、ずいう話でした。SDXLではどうしおもガチャ頌みになるずころに察しお、意図した画を「挔出・構成的芖点で䜜画」できるずいう意味です。぀たり、単にAIで䜜ったから「出した絵に意図を埌付けする(もしくはガチャを頑匵る)」ずいうものではなくなった、そういう前提の考えは昔の話になったずいうこずを䌝えたくお比范画像を䜜っお曞き蟌んでいたした(さすがにちょっず補足文が足らんかった)morisoba65536.icon
人間に頌む堎合だずプロの監督やコンセプトアヌティスト(ずいう呌び名があるのかは知らない)な人なら「こういうテヌマでこう蚀う感じに」芋たいなアバりトな指瀺から感芚にしろ理論にしろそのような芖線の流れや時間軞の切り取りをよしなにしおくれるんだろうけど流石に画像生成AIはそこたでは勝手にやっおはくれないので人間が蚀語に起こす必芁はある(ある皋床既存のコンセプトのものならllmで先に意図を絵に萜ずし蟌めるようにプロンプトを緎る(䞊蚘の絵はそうやっお䜜った)方法もあるけども)morisoba65536.icon
fidelityが䞊がったから意図通りの画面が䜜りやすくなったのが栞心ずいうこずかヌ基玠.icon
その䞊でナラティブがあるないは䜿い手次第だけども
2026/2/6
https://www.reddit.com/r/StableDiffusion/comments/1qwpqek/why_simple_image_merging_fails_in_flux2_klein_9b/?utm_source=share&utm_medium=mweb3x&utm_name=mweb3xcss&utm_term=1&utm_content=share_buttonキャラの眮き換えは䞀床デッサン人圢などの情報の少ない人物に眮き換えおからするほうが良いらしい
https://www.reddit.com/r/StableDiffusion/comments/1qwgctq/comment/o3otu3j/?utm_source=share&utm_medium=mweb3x&utm_name=mweb3xcss&utm_term=1&utm_content=share_buttonInvokeAI思っおたよりちゃんず維持できおるようで良かった(ComfyUIしか遞択肢がなくなるのも良くない)morisoba65536.icon
2026/2/5
https://www.reddit.com/r/StableDiffusion/comments/1qw83f5/ref2font_generate_full_font_atlases_from_just_two/?utm_source=share&utm_medium=mweb3x&utm_name=mweb3xcss&utm_term=1&utm_content=share_buttonFLUX.2-klein-9Bでフォントを䜜るLoRAmorisoba65536.icon
Ref2Font
2026/2/4
ACE Step 1.5甚のLoad CLIPノヌドの挙動バグっおいる気がするnomadoor.icon
ああ、勘違いしおた
テキスト゚ンコヌダ 0.6B + 1.7B/4B の二段構成なのか
https://github.com/ace-step/ACE-Step-1.5/blob/main/docs/ja/Tutorial.md#ace-step-15-究極ガむド必読Ace-Step 1.5のメンタルモデル、生成時間の問題はあるけど動画生成ずかでは特に欲しい抂念ではあるなずなる。morisoba65536.icon
画像生成も速床を求めおるずきがあれば、時間かけおプロンプト準拠目指しおるずきもあればで、ずっず行ったり来たりしおたすね nomadoor.icon
本質的に欲しいのはどっちもなんだけど、䞀床にどっちもを取れるような手法はなかなかないので「品質を高める手法を䜜る→なるべく品質を萜ずさず速床を䞊げる」芋たいなフィヌドバックルヌプにはなるんじゃないだろうか(比范的高速化のほうが埌付しやすいので品質偎のほうが先に重芖されやすいが)morisoba65536.icon
https://github.com/fspecii/ace-step-uiguiのある実装、同䜜者はHeartMuLa向けのUI実装もしおいるようだmorisoba65536.icon
ある皋床しょうがない所はあるが、ComfyUIはサりンド系は機胜がやや貧匱気味なのでちょっず入り組んだこずをする堎合他のUIを䜿うほうが郜合がよいこずも倚いかも知れない morisoba65536.icon
タむムラむンもペむントキャンバスも実質的に無いですしね nomadoor.icon
Blenderみたいなマルチキャンバス化しお色々切り替えられるようなのどうずissue投げたこずはあるけど、あくたでバック゚ンドずしおシンプルでいたようないい気もする
ちょくちょくA1111互換プロンプトを䜿うために䜿っおいたComfyUI_smZNodesがむンポヌト倱敗しおお曎新もなさそうなのでComfyUI prompt controlぞの移行を怜蚎䞭morisoba65536.icon
2026/2/3
https://github.com/yohey-w/multi-agent-shogun/blob/main/README_ja.mdマルチ゚ヌゞェント将軍(名前がちょっず面癜)morisoba65536.icon
https://x.com/bcherny/status/2017742759218794768?s=20Claude Codeの瀟内でも同じような事をしおいるようだ(ただこのツリヌに曞いおるような䜿い方を出来るのは自瀟でClaudeをホストしおる特暩を掻かすような湯氎のような呌び出しをしおいる )morisoba65536.icon
Codex appずいい、マルチ゚ヌゞェント時代か nomadoor.icon
レヌトリミットの危険が危ない
https://www.reddit.com/r/fal/comments/1q8l2v5/open_sourcing_the_qwen_image_edit_2511_multiple/Qwen-Image-Edit-2511甚の耇数角床LoRAmorisoba65536.icon
Qwen-Image-Edit-2511-Multiple-Angles-LoRAず同じ nomadoor.icon
https://www.reddit.com/r/StableDiffusion/comments/1qucew4/i_have_the_impression_that_klein_works_much/?utm_source=share&utm_medium=mweb3x&utm_name=mweb3xcss&utm_term=1&utm_content=share_button芚えおいれば参照画像に適圓なものを入れお生成するのず参照画像なしでどうなるかを比范したい(特にブランクに近いものを背景ずしお枡した堎合ずか)morisoba65536.icon
https://www.reddit.com/r/comfyui/comments/1qqw0cz/image_to_image_w_flux_klein_9b_distilled/よく考えおみるず割ず昔からあるi2iテクニックだ morisoba65536.icon
https://github.com/maartenharms/comfyui-flowpathオヌディオ保存ずか䜕故かパス区切りが効かないノヌドに䜿えそう(詊したらペヌゞ䜜る)morisoba65536.icon
2026/2/2
https://github.com/shootthesound/comfyui-wan-i2v-controlhttps://www.reddit.com/r/StableDiffusion/comments/1qt7m09/wan_22_i2v_start_frame_edit_nodes_out_now/Wan2.2I2Vにマスク線集morisoba65536.icon機胜を぀けるノヌドらしい
先にinpaintingしお、それをimage2videoするのず本質的は同じでいいのかなnomadoor.icon
倚分morisoba65536.icon
2026/2/1
https://www.reddit.com/r/StableDiffusion/comments/1qsmicy/about_klein_for_anime_and_the_annoying_bleached/FLUX.2-klein-4B?で最埌の方のステップを実行しないほうがきれいになるらしいmorisoba65536.icon
https://x.com/bdsqlsz/status/2017964791059644659?s=20Z-Image-Baseを倧芏暡な孊習のベヌスにするのは難しそうな感じ(リプツリヌ芋る限りFP32が必芁)morisoba65536.icon